鉴于获得大量标记数据的潜在困难,许多作品探索了使用深度半监督学习,它使用标记和未标记的数据来培训神经网络架构。绝大多数SSL方法侧重于实现低密度分离假设或一致性假设,决策边界应该位于低密度区域的想法。但是,它们通过对每个数据点的决策边界进行本地更改来实现这一假设,忽略了数据的全局结构。在这项工作中,我们使用群集数据中存在的全局信息来探索替代方法来更新我们的决策边界。我们提出了一种新颖的框架,Cyclecluster,用于深度半监督分类。我们的核心优化由基于新的聚类正则化以及基于图形的伪标签和共享的深网络的基于群集的正规化驱动。展示集群假设的直接实现是基于流行的一致性正规化的可行替代方案。我们通过仔细的数值结果展示了我们技术的预测能力。
translated by 谷歌翻译
In this work, we propose a novel framework for estimating the dimension of the data manifold using a trained diffusion model. A trained diffusion model approximates the gradient of the log density of a noise-corrupted version of the target distribution for varying levels of corruption. If the data concentrates around a manifold embedded in the high-dimensional ambient space, then as the level of corruption decreases, the score function points towards the manifold, as this direction becomes the direction of maximum likelihood increase. Therefore, for small levels of corruption, the diffusion model provides us with access to an approximation of the normal bundle of the data manifold. This allows us to estimate the dimension of the tangent space, thus, the intrinsic dimension of the data manifold. Our method outperforms linear methods for dimensionality detection such as PPCA in controlled experiments.
translated by 谷歌翻译
几何图是一个组合图,并具有从其嵌入欧几里得空间中继承的几何形状。在两个几何图形的组合和几何结构中,在组合和几何结构中的(差异)相似性的有意义衡量是一个具有挑战性的问题。我们研究了几何图的距离度量的两个概念,称为几何编辑距离(GED)和几何图距离(GGD)。尽管前者是基于编辑一个图以将其转换为另一个图的想法,但后者的灵感来自图形的不精确匹配。几十年来,这两个概念一直在归因于归因图之间相似性的衡量标准。但是,如果没有任何修改,它们将无法为几何图提供有意义的距离度量 - 甚至不再是度量标准。我们已经为几何图的上下文策划了它们相关的成本功能。除了研究GED和GGD的度量特性外,我们研究了这两个概念的比较。我们通过证明距离为$ \ Mathcal {np} $ - 很难计算,即使图形是平面,并且允许任意成本系数,我们也很难计算GGD的计算方面。
translated by 谷歌翻译
手术动作三胞胎识别提供了对手术场景的更好理解。这项任务具有很高的相关性,因为它为外科医生提供了背景感知的支持和安全性。当前改善绩效的首选策略是开发新的网络机制。但是,当前最新技术的性能大大低于其他手术任务。为什么会发生这种情况?这是我们在这项工作中解决的问题。我们提出了第一项研究,以了解现有的深度学习模型通过稳健性和解释的镜头的失败。首先,我们通过对抗优化方案研究了当前的现有模型。然后,我们通过基于功能的解释提供故障模式。我们的研究对提高性能和提高可靠性的关键是核心和虚假属性。我们的工作为外科科学中更具可信赖性和可靠性的深度学习模型打开了大门。
translated by 谷歌翻译
我们将WS-DINO作为一种新型框架,以从细胞的高内感荧光图像学习表型表示中使用弱标记信息。我们的模型基于具有视觉变压器骨干(Dino)的知识蒸馏方法,我们将其用作研究的基准模型。使用WS-DINO,我们对高含量显微镜屏幕(处理和化合物)中可用的弱标签信息进行了微调,并在BBBC021数据集的非同样化合物的动作预测中实现了最先进的性能(98%),并使用该化合物作为弱标签,而非类型的化合物和批处理性能(96%)。我们的方法绕过单细胞种植作为预处理步骤,并使用自发图表表明该模型学习结构上有意义的表型曲线。
translated by 谷歌翻译
算法选择向导是有效且通用的工具,它们会自动选择有关该问题和可用计算资源的高级信息的优化算法,例如决策变量的数量和类型,最大程度的评估数量,并行评估等。艺术算法选择向导很复杂且难以改进。我们在这项工作中建议使用自动配置方法来通过找到构成它们的算法的更好配置来改善其性能。特别是,我们使用精英迭代赛车(IRACE)来找到特定人工基准测试的CMA配置,这些基准取代了Nevergrad平台提供的NGOPT向导中当前使用的手工制作的CMA配置。我们详细讨论了IRACE的设置,目的是生成在每个基准内的各种问题实例集合中都可以正常工作的配置。我们的方法也提高了NGOPT向导的性能,即使在不属于Irace的一部分的基准套件上。
translated by 谷歌翻译
在实际优化方案中,要求我们解决的问题实例可能会在优化过程中发生变化,例如,当可用新信息或环境条件发生变化时。在这种情况下,人们可以希望通过从最佳解决方案的最佳解决方案继续进行搜索来实现合理的绩效。同样,人们可能希望,在解决彼此相似的几个问题实例时,````温暖启动'''第二个实例的优化过程是通过第一个实例的最佳解决方案的优化过程。但是,在[Doerr等人,GECCO 2019]中显示,即使使用结构良好的解决方案初始化,进化算法也可能具有通过结构上更糟糕的解决方案替换这些良好溶液的趋势,从而导致优化时间与没有优化的时间相比没有优化的时间。相同的算法从头开始。 Doerr等人。还提出了一种克服这个问题的多样性机制。他们的方法平衡了围绕当前问题的最佳解决方案的贪婪搜索,并在上一个实例的最佳发现解决方案周围进行搜索。在这项工作中,我们首先表明Doerr等人建议的重新优化方法。当问题实例容易发生更频繁的更改时,达到限制。更确切地说,我们证明它们被陷入了动态领导问题问题,目标字符串定期更改。然后,我们提出了其算法的修改,该算法在围绕先前最佳和当前最佳解决方案围绕贪婪的搜索进行了插值。我们从经验上评估了具有各种变化频率和不同扰动因素的前导者实例上的平滑重优化算法,并表明它表现出优于完全重新启动的(1+1)进化算法和Doerr等人的重新挑选方法。
translated by 谷歌翻译
从早期图像处理到现代计算成像,成功的模型和算法都依赖于自然信号的基本属性:对称性。在这里,对称是指信号集的不变性属性,例如翻译,旋转或缩放等转换。对称性也可以以模棱两可的形式纳入深度神经网络中,从而可以进行更多的数据效率学习。虽然近年来端到端的图像分类网络的设计方面取得了重要进展,但计算成像引入了对等效网络解决方案的独特挑战,因为我们通常只通过一些嘈杂的不良反向操作员观察图像,可能不是均等的。我们回顾了现象成像的新兴领域,并展示它如何提供改进的概括和新成像机会。在此过程中,我们展示了采集物理学与小组动作之间的相互作用,以及与迭代重建,盲目的压缩感应和自我监督学习之间的联系。
translated by 谷歌翻译
在这项工作中,我们提出了一个新的范式,用于使用降低性降低方案(包括Minibatch梯度近似和操作员草图)设计有效的深层展开网络。深度展开的网络目前是成像逆问题的最新解决方案。然而,对于高维成像任务,尤其是X射线CT和MRI成像,由于需要多次计算高维向前和邻接运算符,因此深层展开方案通常在记忆和计算方面效率低下。最近,研究人员发现,可以通过展开随机梯度下降(SGD)来部分解决此类局限性,这受到随机一阶优化的成功的启发。在这项工作中,我们基于最先进的原始偶(LPD)网络,进一步探讨了这一方向,并首先提出了更具表现力和实用的随机原始偶发性展开,也是随机原始的进一步加速 - 双曲线,使用素描技术在高维图像空间中近似产品。操作员素描可以与随机展开共同应用,以获得最佳的加速度和压缩性能。我们对X射线CT图像重建的数值实验证明了我们加速展开方案的显着有效性。
translated by 谷歌翻译
实用的图像分割任务涉及必须从嘈杂,扭曲和/或不完整的观察值重建的图像。解决此类任务的最新方法是使用分段共同执行此次重建,使用每个分段来指导彼此。但是,迄今为止,这项工作采用了相对简单的分割方法,例如Chan - VESE算法。在本文中,我们提出了一种使用基于图的分割方法进行联合重建分割的方法,该方法一直在看到最近的兴趣增加。由于涉及的矩阵尺寸较大而引起并发症,我们展示了如何管理这些并发症。然后,我们分析我们方案的收敛属性。最后,我们将此方案应用于``两个母牛''图像的扭曲版本,该版本是先前基于图的分割文献中熟悉的``两个奶牛''图像,首先是高度噪声的版本,其次是模糊的版本,在两种情况下都可以实现高度准确的细分。我们将这些结果与通过顺序重建分割方法获得的结果进行比较,发现我们的方法与重建和分割精度相比,甚至均超过了这些方法。
translated by 谷歌翻译